Funciones fundamentales de Análisis de Supervivencia

Introducción

En esta sección abordaremos los conceptos fundamentales para el análisis de datos de supervivencia, comenzando con funciones de probabilidad clásicas y avanzando hacia funciones específicas como la función de supervivencia y la función de riesgo.

Objetivos

  • Recordar las funciones de densidad y distribución acumulada.
  • Introducir la función de supervivencia \(S(t)\) y la función de riesgo \(h(t)\).
  • Interpretar estas funciones desde una perspectiva probabilística.
  • Visualizar ejemplos aplicados y comparativos con distintas distribuciones.

Funciones fundamentales

Antes de introducir las funciones de supervivencia y riesgo, recordemos dos funciones clave en probabilidad y estadística:

  • Función de densidad: \(f(t)\)
  • Función de distribución acumulada: \(F(t) = P(T \leq t)\)

Función de densidad \(f(t)\)

  • Describe la distribución de probabilidad de una variable continua \(T\)

  • No es una probabilidad en sí, pero su integral sí lo es:

    \[ P(a < T \leq b) = \int_a^b f(t) \, dt \]

  • Debe cumplir:

    \[ f(t) \geq 0 \quad \text{y} \quad \int_{-\infty}^{\infty} f(t) \, dt = 1 \]

Función de distribución acumulada \(F(t)\)

  • Es la probabilidad de que la variable aleatoria tome un valor menor o igual que \(t\):

    \[ F(t) = \int_{-\infty}^t f(u) \, du = P(T \leq t) \]

  • Propiedades:

    • \(F(t)\) es monótona creciente
    • \(\lim_{t \to -\infty} F(t) = 0\)
    • \(\lim_{t \to \infty} F(t) = 1\)

Relación entre \(f(t)\) y \(F(t)\)

  • Si \(f\) es continua:

    \[ f(t) = \frac{d}{dt} F(t) \]

  • Y también:

    \[ F(t) = \int_{-\infty}^t f(u) \, du \]

Estas relaciones son clave para definir funciones como la de supervivencia y la de riesgo, que veremos a continuación.

Ejemplo en R: distribución distribución exponencial con parámetro \(\lambda = 0.5\)

Funciones fundamentales en análisis de supervivencia

En análisis de supervivencia, las variables aleatorias de interés \(T\) son no negativas, y se caracterizan no solo por \(f(t)\) o \(F(t)\), sino también por funciones más interpretables:

  • \(S(t)\): función de supervivencia
  • \(h(t)\): función de riesgo o tasa de falla
  • \(H(t)\): riesgo acumulado

Función de supervivencia \(S(t)\)

Función de Supervivencia

La función de supervivencia \(S(t)\) y la función de riesgo instantáneo \(h(t)\) son fundamentales para modelar procesos de falla en este tipo de análisis, ver Klein & Moeschberger (2003).

\(S(t) = P(T > t) = 1 - F(t)\)

Representa la probabilidad de sobrevivir más allá del tiempo \(t\).

Propiedades clave:

  • Monótona no creciente
  • \(S(0) = 1\), \(\lim_{t \to \infty} S(t) = 0\)

Ejemplo: función de supervivencia para distribución exponencial

Sea \(T \sim \text{Exp}(\lambda = 0.5)\), es decir:

\[ f(t) = \lambda e^{-\lambda t}, \quad F(t)=1-e^{-\lambda t}, \quad S(t) = e^{-\lambda t} \]

Función de riesgo \(h(t)\)

Función de Riesgo

\(h(t) = \frac{f(t)}{S(t)}\)

  • También conocida como:
    • Tasa de falla condicional (confiabilidad)
    • Tasa de mortalidad (demografía)
    • Función de intensidad (procesos estocásticos)

Interpretación:
Tasa instantánea de ocurrencia del evento, dado que se ha sobrevivido hasta \(t\).

Ejemplos de formas de riesgo

Forma del riesgo Interpretación
Riesgo creciente Envejecimiento
Riesgo decreciente Rejuvenecimiento
Riesgo tipo “tina de baño” Mortalidad neonatal y senil
Riesgo tipo “montaña” Recaída tras tratamiento

Ejemplo: función de riesgo para distribuciones comunes

\[ h(t) = \frac{f(t)}{S(t)} \]

Para la distribución exponencial con \(\lambda = 0.5\), \(h(t) = \lambda\), constante.

Comparémosla con la distribución Weibull, donde el riesgo puede aumentar o disminuir con el tiempo.

Otra forma de visualización

Tiempo discreto

Riesgo en tiempo discreto

Para \(T\) discreta con soporte \(\{u_1, u_2, \dots\}\):

\[ h(t) = P(T = t \mid T \ge t) \]

\[ h_k = \frac{P(T = u_k)}{P(T \ge u_k)} = \frac{f(u_k)}{S(u_{k-1})} \]

Usando \(f(u_k) = S(u_{k-1}) - S(u_k)\), se obtiene:

\[ h_k = 1 - \frac{S(u_k)}{S(u_{k-1})} \]

Relaciones discretas clave

Función de supervivencia:

\[ S(t) = \prod_{u_k \le t} (1 - h_k) \]

Función de densidad:

\[ f(u_j) = h_j \prod_{k<j} (1 - h_k) \]

En demografía, \(h(t)\) representa la probabilidad de morir en el momento \(t\) dado que se ha sobrevivido hasta \(t\).

Ejemplos de riesgo discreto

Riesgo acumulado discreto

Dos definiciones equivalentes:

  1. Suma directa: \[ H(t) = \sum_{u_k \le t} h_k \]

  2. Log-transformación: \[ H(t) = - \sum_{u_k \le t} \log(1 - h_k) \]

Ambas son monótonas no decrecientes.

Tiempo contínuo

Riesgo en tiempo continuo

\[ h(t) = \lim_{\varepsilon \to 0} \frac{1}{\varepsilon} P(t < T \le t + \varepsilon \mid T \ge t) = \frac{f(t)}{S(t)} \]

Como \(F(t) = 1 - S(t)\), entonces:

\[ h(t) = -\frac{d}{dt} \log S(t) \]

Al integrar:

\[ \log S(t) = -\int_0^t h(u) \, du \]

\[ S(t) = \exp\left(-\int_0^t h(u) \, du\right) \]

\(h(t)\varepsilon\) es la probabilidad aproximada de que un evento ocurra en el siguiente instante dado que el individuo ha sobrevivido hasta \(t\).

Riesgo acumulado continuo

\[ H(t) = \int_0^t h(u)\, du \qquad\Rightarrow\qquad S(t) = \exp\{-H(t)\} \]

Si \(S(\infty) = 0\), entonces \(H(\infty) = \infty\).

Visualización de funciones

Visualización de funciones (cont.)

Visualización de Funciones en R

Las funciones Surv() y survfit() del paquete survival permiten ajustar y visualizar curvas de Kaplan-Meier de manera eficiente en R, ver Moore (2016) y Therneau & Grambsch (2000).

# Ejemplo simulado de tiempos de supervivencia
set.seed(123)
tiempos <- rexp(10, rate = 0.05)
status <- rbinom(10, 1, prob = 0.8)
data_sim <- data.frame(time = tiempos, event = status)
# Estimación Kaplan-Meier
km_fit <- survfit(Surv(time, event) ~ 1, data = data_sim)
data_sim
time event
16.8691452 1
11.5322054 0
26.5810974 0
0.6315472 1
1.1242195 1
6.3300243 0
6.2845458 1
2.9053361 1
54.5247293 1
0.5830689 1
plot(km_fit, 
     xlab = "Tiempo", 
     ylab = "Supervivencia", 
     main = "Curva Kaplan-Meier")

Referencias

Klein, J. P., & Moeschberger, M. L. (2003). Survival analysis: Techniques for censored and truncated data (2nd ed.). Springer.
Moore, D. F. (2016). Applied survival analysis using r (2nd ed.). Springer. https://doi.org/10.1007/978-3-319-31245-3
Therneau, T. M., & Grambsch, P. M. (2000). Modeling survival data: Extending the cox model. Springer.